由於大致上基本的機器學習影像處理結束了,今天我們來回顧一下所有講的內容吧
張量
我們進行機器學習的最基本模組我們可以透過它表示各種資料以及利用它來進行運算操作。
Rank: 表示資料集合的結構。
點積: 是用來表達為向量的張量間相似性質的方法,越相似則點積越高。
影像張量
通常為2rank並利用RGB來表示,當我們使用html以及canvas(畫布)來視覺化修改儲存影像時,我們將把張量rander(渲染)到畫布上,而轉入張量的影像可以是多元甚至是動態的,我們可以傳入各式各樣的元素例如 javascript imageData和Image物件還有各種html元素。
影像修改
鏡像張量
當正在嘗試訓練識別某種東西的模型時,可透過對現有的識別物照片透過鏡向來對資料集大小加倍。稍微整訓影像以擴增資料即是一種常見的做法。
調整大小
分為像素化和模糊化
裁切
利用座標位置訂出範圍
模型
TFHub 模型中的Inception v3 最大的特點是到第三個版本時已經接受數十萬張影像的訓練了,此模型權重有91.02mb且能對1001種不同的物件進行分類。
疊加模型
輸出定界框是一件非常複雜的事情,因為他必須處裡各種不同類別以及重疊的框,所以與其花費心力用數學運算特別去清理不必要的類別不如專注在tensflow.js上用一個矩形框出我們所需要的,這就是所謂的本地化物件
Lou和NSM
Lou = 交集/聯集
NSM自動抓取分數最高的框並刪除所有超過IOU指定等級的類似框。
註解標籤
低對比度
添加背景框解決
疊加問題
使用globalCompositeOperation確定上下位置並將文字最後加上確保它在最上層
網路攝影機
將載入模組等設定設為最先執行並在重複執行的迴圈外以節省載入的時間
大概就這樣,謝謝大家